FILTER MODE ACTIVE

#математическое рассуждение

Найдено записей: 8

#математическое рассуждение25.11.2025

Agent0: самообучающаяся LLM, осваивающая инструменты и решающая сложную математику без внешних данных

'Agent0 коэволюционирует генератор задач и исполнителя из одного базового LLM, используя песочницу Python и адаптивный RL для улучшения математических и общих навыков без внешних данных.'

#математическое рассуждение30.08.2025

rStar2-Agent: как 14B модель с агентным RL обходит более крупные модели в математике

'Модель rStar2-Agent использует исполнение Python-кода в цикле рассуждений, что позволяет 14-миллиардной модели обойти более крупные системы на математических бенчмарках.'

#математическое рассуждение04.08.2025

ByteDance представляет Seed-Prover: прорыв в автоматическом доказательстве математических теорем

ByteDance представила Seed-Prover — инновационную систему доказательства на основе лемм, которая добилась прорывных результатов, решив 5 из 6 задач IMO 2025 и превзойдя множество других бенчмарков.

#математическое рассуждение11.07.2025

Microsoft Представляет Phi-4-mini-Flash-Reasoning: Быстрая и Компактная Модель для Сложных Задач с Длинным Контекстом

Microsoft представила Phi-4-mini-Flash-Reasoning — компактную модель с 3.8 млрд параметров, оптимизированную для эффективного анализа длинных контекстов и быстрого вывода, превосходящую предыдущие модели на сложных задачах.

#математическое рассуждение06.07.2025

Новый метод Meta и NYU: Полуонлайн обучение с подкреплением для улучшения выравнивания LLM

Meta и NYU разработали полуонлайн метод обучения с подкреплением, который балансирует офлайн и онлайн подходы для улучшения выравнивания больших языковых моделей и повышения их производительности в инструкциях и математике.

#математическое рассуждение01.07.2025

OMEGA: Новый бенчмарк для оценки творческих возможностей ИИ в математических рассуждениях

OMEGA — новый бенчмарк для проверки границ математического рассуждения больших языковых моделей, фокусируясь на исследовательском, композиционном и трансформационном обобщении.

#математическое рассуждение27.06.2025

GURU: Продвинутое обучение с подкреплением для многоцелевого рассуждения в шести областях

GURU представляет многоцелевой набор данных и модели обучения с подкреплением, значительно повышающие способности больших языковых моделей к рассуждению в шести различных областях и превосходящие предыдущие открытые модели.

#математическое рассуждение02.05.2025

MiMo-7B от Xiaomi: компактная модель ИИ, превосходящая большие аналоги в математике и программировании

MiMo-7B от Xiaomi — компактная языковая модель, которая благодаря продвинутому предобучению и обучению с подкреплением превосходит более крупные модели в задачах математики и программирования.